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Abstract of DE1 9540795 

The method involves using the microphone 
array for the speaker location, such that ail the 
microphone signals of the array are 
simultaneously evaluated. The speech region 
is divided into numerous, finite sectors, and 
the correct sector is selected according to the 
plausibility criteria. The individual microphone 
signals, connected for their transit time and 
phase values, are tested against each other 
for the phase position coherence, prior to 
forming the array summation signal. Then the 
sector with maximum coherence is selected. 
Preferably during this test, varying frequency 
band decisions are taken, also according to 
the maximum coherence. 
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Verfahren zur Sprecherlokalisierung mit Hilfe eines Mikrofonarrays 

Verfahren zur Sprecherlokalisierung mit Hilfe eines Mi- 
krofonarrays, bei dem alle Mikrofonsignale des Arrays 
gleichzeitig ausgewertet werden und der Sprecherraum 
in endlich viele Sektoren aufgeteilt und der zutreffende 
Sektor nach Kriterien der Plausibilitat ausgewahlt wird, 
dadurch gekennzeichnet, daS die laufzeit- bzw. phasen- 
korrigierten, einzelnen Mikrofonsignale vor der Bildung 
des Array-Summensignals miteinander auf Koharenz der 
Phasenlage gepruft werden und danach der Sektor mit 
maximaler Koharenz ausgewahlt wird. 
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Beschreibung 



[0001] Die Erfindung bezieht sich auf ein Verfahren zur 
Sprecherlokalisierung mit Hilfe eines Mikrofonarrays der 
im Oberbegriff des Paten tansprucb 1 naher definierten Art. 5 
Ein derartiges Verfahren ist z. B. von W. Kellermann: "A 
selfsteering digital microphone array", Int. Conf. Acoust., 
Speech and Signal Proc. ICASSP'91, Toronto, 1991, S. 
3581-3584 beschrieben. 

[0002] Beim Freisprechen in gerauschbelasteter Umge- 10 
bung bietet der Einsatz eines Mikrofonarrays eine wirkungs- 
volle Moglichkeit zur Reduktion des aufgenommenen Ge- 
rauschsignales, das dem gewiinschten Sprachsignal iiberla- 
gert ist. Voraussetzung fur eine optimale Funktion des Mi- 
krofonarrays ist jedoch, daB die Hauptkeule im Richtdia- 15 
gramm des Arrays moglichst genau auf die Position des 
Sprechers ausgerichtet ist. 

[0003] Zur Sprecherlokalisierung fur den Einsatz von Mi- 
krofonarrays sind eine Reihe von Verfahren in der Literatur 
beschrieben und zum Teil auch realisiert worden. Die mei- 20 
sten dieser Verfahren beruhen auf einer Kreuzkorrelations- 
analyse von jeweils einem Paar von Mikrofonsignalen. Aus 
der zeitlichen Lage des Maximums der Kfeuzkorrelation 
kann auf den Zeitversatz des Sprachsignals im Signalpaar ■ 
geschlossen werden. Eine Fortfuhrung der Kreuzkorrelati- 25 
onsanalyse fur andere Signalpaare mit anschlieBender Aus- 
wertung ermoglicht dann einen RuckschluB auf die mut- 
maBliche Sprecherposition. Der erforderliche Rechenauf- 
wand ist nicht sehr hoch, nachteilig ist jedoch die erhohte « 
Fehleranfalligkeit bei ungunstigen SNR-Werten. 30 
[0004] Eine wesentlich robustere Schatzung der Sprecher- 
position ist moglich, wenn nicht einzelne Signalpaare, son- 
dern die Kombination aller Mikrofonsignale aus dem Mi- 
krofonarray gleichzeitig ausgewertet wird. Dazu gibt es ei- 
nen Vorschlag in der Dissertation "Gerauschreduktion bei 35 
Sprachubertragung mit Hilfe von Mikrofonarraysyste- 
men'VS. Gierl, Universitat Karlsruhe, 1990, der dort als 
"Fehlerfunktionsmethode" beschrieben wird. Von groBem 
Nachteil ist jedoch der dazu erforderliche, extrem hohe Re- 
chenaufwand, der eine Echtzeitrealisierung mit heute ver- 40 
fugbarer Technologie nicht gestattet. 

[0005] Ein anderes Konzept zur Schatzung der Sprecher- 
position, das ebenfalls auf einer gleichzeitigen Auswertung 
aller Mikrofonkanale b eruht, ist bereits mit heutiger Techno- 
logie in Echtzeit realisierbar. Hierbei wird der dreidimensio- 45 
nale Raum, der die zulassigen Sprecherpositionen be- 
schreibt, in endlich viele Sektoren unterteilL Fur jeden Sek- 
tor ist ein Satz von Parameterwerten zur Richtungssteuerung 
des Mikrofonarrays abgespeichert, der dem raumlichen 
Zentrum des jeweiligen Sektors zugeordnet ist. Zur Durch- 50 
fuhrung der Sprecherlokalisierung werden alle Sektoren ab- 
gepruft, und das jeweilige Array-Ausgangssignal wird ana- 
lysierL Entschieden wird fur denjenigen Sektor, fur den sich 
die groBte Plausibilitat aufgrund eines ausgewahlten Kriteri- 
ums ergibt. Hierzu gibt es verschiedene Vorschlage, z. B. die 55 
Suche nach der maximalen Signalamplitude unter Einhal- 
tung weiterer Randbedingungen (J. L. Flanagan et al.: 
"Computersteered microphone arrays for sound transduc- 
tion in large rooms". J. Acoust. Soc. Am., Vol. 78, Nov. 
1985, S. 1508-1518) oder gar der Einsatz von Verfahren der 60 
Mustererkennung (W. Kellermann: "A selfsteering digital 
microphone array". Int. Conf. Acoust,, Speech and Signal 
Proc. ICASSPT91, Toronto, 1991, S. 3581-3584). Diese 
Aus werte verfahren sind jedoch primar fur Fernfeldbedin- 
gungen optimiert, also bei groBerem Abstand zwischen 65 
Sprecher und Mikrofonarray. Weiterhin sind gewisse Kennt- 
nisse uber die Statistik von Sprach- und Storsignal erforder- 
lich, um zu vermeiden, daB eine Storquelle als vermeintli- 



ches Sprachsignal detektiert wird. 

[0006] Aufgabe der Erfindung ist es, ein Verfahren zu 
schaffen, das eine Sprecherlokalisierung im Nahfeld, auch 
bei starken Storschallquellen in der Umgebung des Spre- 
chers, mit geringem Zeit- und Rechenaufwand ermoglicht, 
[0007] Die Erfindung lost diese Aufgabe mit dem im Pa- 
tentanspruch 1 aufgefuhrten Verfahren. 
[0008] Mit den in den Unteranspriichen 2 bis 5 angefuhr- 
ten, vorteilhaften Weiterbildungen des Verfahrens wird die 
Sicherheit gegenUber Fehleinstellungen und Storbeeinflus- 
sungen weiter erhoht. 

[0009] Die Erfindung wird nachfolgend anhand von Aus- 
fuhrungsbeispielen naher erlautert In den zugehorigen 
Zeichnungen zeigen die: 

[0010] Fig. 1 ein vereinfachtes Gesamtblockbild, 

[0011] Fig. 2 das Blockbild zur KoharenzmaB-Bestim- 

mung, 

[0012] Fig. 3 die Details zur Grobsuche, 
[0013] Fig. 4 die Details zur Feinsuche und 
[0014] Fig. 5 die Details zur Nah-/Fern-Prufung. 
[0015] Im Gegensatz zu den oben beschriebenen Verfah- 
ren unter Annahme von Femfeldbedingungen ist das in die- 
ser Erfindung beschriebene Verfahren zur Sprecherlokalisie- 
rung fur das Freisprechen im Nahfeld optimiert, also fur Ab- 
stande zwischen Sprecher und Mikrofonarray etwa im Be- 
reich von 0,3 .. . 0,8 m. Basis ist zunachst wieder die Unter- 
teilung des Sprecherraumes in endlich viele Sektoren. Die 
Auswertung der Array- Ausgangssignale erfolgt jedoch nach 
einem neuen, bisher noch nicht vorgeschlagenen Verfahren. 
[0016] Beim Freisprechen im Nahfeld kann ausgenutzt 
werden, daB der Direktschall des Sprachsignals vpm ge- 
wiinschten Sprecher dominiert gegenuber Sprach-Schallan- 
teilen (und auch Stprschallanteilen) infolge von Refiexionen 
an den Raumbegrenzungsflachen. Wird also bei der Spre- 
cherlokalisierung gerade der "richtige M Raumsektor abge- 
priift, so weisen die laufzeit- bzw. phasenkorrigierten Mi- 
krofonsignale unmittelbar vor Bildung des Array-Summen- 
signals beziiglich des Sprachsignals alle die gleiche Phasen- 
lage auf ("koharenter SchalleinfaU"). Bei der Auswertung 
der Arraysignale wird nun ein KoharenzmaB bestimmt, das 
um so groBer ist, je geringer die Phasenunterschiede der kor- 
rigierten Mikrofonsignale sind. Bei der Sprecherlokalisie- 
rung wird dann fur denjenigen Sektor entschieden, bei dem 
sich das groBte KoharenzmaB einstellt 
[0017] Der wesentliche Vorteil des hier beschriebenen 
Verfahrens besteht darin, daB eine Kenntnis uber die Stati- 
stik von Sprach- und Storsignal nicht erforderlich ist. Das 
Verfahren arbeitet wirkungsvoll fur beliebige Sprecher und 
auch fur beliebige, storende Gerauschquellen in der Umge- 
bung des Sprechers. Die Gerauschquellen durfen dabei auch 
aus Sprachsignalen bestehen. Das gewiinschte Sprachsignal 
bzw. die dazugehorige Sprecherposition wird allein auf 
Grund der Koharenzeigenschaften im Nahfeld bestimmt. 
[0018] Bei dem in der Erfindung beschriebenen Verfahren 
erfolgt die Analyse der Signale des Mikrofonarrays im Fre- 
quenzbereich. Durch eine automatische Steuerung wird ge- 
wahrleistet, daB nur solche Frequenzbander zur Bestim- 
mung des KoharenzmaBes beriicksichtigt werden,>die am 
wenigsten gestort sind, also die groBten Koharenzbeitrage 
beisteuem. Der Vorteil dieser Vorgehensweise besteht darin, 
daB eine sichere Sprecherlokalisierung auch noch bei sehr 
starken Umgebungsgerauschen moglich ist. 
[0019] Zu der vorliegenden Erfindung wird eine Schal- 
tungsanordnung beschrieben, die eine ausreichend genaue 
Lx)kalisierung des Sprechers auch bei sehr ungunstigen Si- 
gn al-zu-Rausch-Abstanden (SNR) ermoghcht, ohne Kennt- 
nisse uber die Statistik von Sprach- bzw. Gerauschsignal 
vorauszusetzen. 
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[0020] Im vereinfachten Gesamtblockbild (Fig. 1) der 
Schaltungsanordnung besteht das Mikrofonarray aus KMi- 
krofonen l t . . . 1 K . Jedes der Mikrofonsignale 2 X ... 2 K 
wird einer eigenen Analyse-Filterbank zugefuhrt. Die Ana- 
lyse-Fiiterbanke 3 X . . . 3 K fiihren jeweils eine Transforma- 5 
tion des Zeitsignals in den Frequenzbereich durch und lie- 
fern K Frequenzbereichsignale 4 X . . . 4 K . Die Analyse-Fil- 
terbank realisiert eine Frequenzbandzerlegung des Gesamt- 
bandes in L Teilbander. .Dann besteht jedes der Signale 4 r 
. . . 4 K aus L Komponenten, die den komplexen Fourier- Ko- 10 
effizienten F L . . . Fl bei einer Spektralanalyse entsprechen. 
Die Berechnung der Signale 4 L . . . 4 K wird zeitperiociisch 
wiederholt, und die Signalwerte iiber N Zeitperioden wer- 
den im Datenpuffer 5 zwischengespeichert. Der Datenpuffer 

5 enthalt also die komplexen Frequenzbereichs-Signalwerte 15 
geordnet iiber N Zeitpunkte, L Frequenzbander und K Mi- 
krofonkanale. 

[0021] Zur Reduktion des Gesamt-Rechenaufwandes wird 
die Suche nach dem zu bestimmenden Sektor, in dem der 
Sprecher sich am wahrscheinlichsten aufhalt, zweistufig 20 
durchgefuhrt: Zunachst wird nur die ungefahre Position er- 
mittelt, wobei ein grobes Sektorraster mit relativ wenigen 
Sektoren (Anzahl SG) zugrunde gelegt wird ("Grobsuche"). 
AnschlieBend wird ein wesentlich feiner abgestuftes Sektor- 
raster um die in der ersten Stufe ermittelte Position herum- 25 
gelegt rnit SF Feinsektoren ("Feinsuche"). 
[0022] Die Grobsuche erfolgt mittels cier Schaltungsan- 
ordnung 16, in welche die komplexen Fourier-Koeffizienten 

6 eingespeist werden. Im Parameterspeicher 13 befinden 
sich die komplexen Array-Koeffizienten Aorob* die den 30 
moglichen Sprecherpositionen im Grob- Sektorraster zuge- 
ordnet sind. Fiir jeden der SG Grobsektoren und jedes der L 
Teilbander ist ein eigener Satz von komplexen Array-Koef- 
fizienten A i . . . A K festgelegt, der jeweils iiber die Leitung 7 . 
in die Stufe 16 eingespeist wird. Die Phasenwinkel der Ar- 35 
ray-Koeffizienten sind so berechnet, daB nach Durchfuh- 
rung des Laufzeitausgleichs in der Stufe 16 die Signalpha- 
sen in den Kanalen 1 . . . K pro Teilband untereinander 
gleich sind, wenn der Sprecher sich tatsachlich in der zu- 
grunde gelegten Sektor-Position aufhalten wiirde. , 40 
[0023] Die getroffene Vorentscheidung iiber einen Sektor 
im Grobraster wird iiber den Eingang 10 der Schaltungsan- 
ordnung 17 (Feinsuche) zugefuhrt. Im Parameterspeicher 14 
befinden sich die komplexen Array-Koeffizienten A Fcin , die 
den moglichen Sprecherpositionen im Feiri-Sektorraster zu- 45 
geordnet sind. Jedem der SG Grobsektoren ist ein Satz von 
SF Feinsektoren zugeordnet (die Feinsektoren bilden eine 
Unterteilung des betreffenden Grobsektors), wobei . zu je- 
dem Feinsektor die komplexen Array-Koeffizienten fur K 
Kanale und L Teilbander gespeichert sind. Aus den Array- . 50 
Koeffizienten 8, die nach dem gleichen Kriterium wie bei 
der Grobsuche berechnet wurden, und den Fourier-Koeffi- 
zienten 6 wird in der. Stufe 17 der optimale Sektor im Fein- 
raster - also die mutmaBliche Sprecherposition - ermittelt. 
Die getroffene Entscheidung 11 wird der Schaltungsanord- 55 
nung 18 (Nah-/Fern-Priifung) zugefuhrt. 

[0024] In der Stufe M Nah-/Fern-Priifung" wird uberpriift, 
ob die geortete Schallquelle sich tatsachlich im Nahfeldbe- 
reich befindeL Dadurch kann verhindert werden, daB das 
Mikrofonarray auf eine energiereiche Storquelle (z. B. ein 60 
lauter Sprecher im Hintergrund) ausgerichtet wird, die je- 
doch - aufgrund ihres groBeren Abstandes zum Mikrofonar- 
ray - von vornherein als zulassige Sprachqueile ausge- 
schlossen werden kann. Die Array-Koeffizienten Apc^em 
im Datenspeicher 15 sind fur Fernfeldbedingungen berech- 65 
net. Jedem Sektor im Feinraster ist hierbei ein Sektor mit 
den gleichen Einfallswinkeln zum Mikrofonarray zugeord- 
net, jedoch mit dem Abstand zwischen Schallquelle und Mi- 



krofonarray gegen Unendlich. Die Fourier-Koeffizienten 6 
und die Array-Koeffizienten 9 werden der Stufe 18 zuge- 
fuhrt Hier wird uberpriift, ob fiir den aus der Stufe 17 be- 
stimmten Feinraster-Sektor eine Nahfeld- oder Fernfeld-Si- 
tuation vorliegt. Ist eine Fernfeld-Situation wahrscheinli- 
cher, so wird die aus der Feinsuche getroffene Entscheidung 
11 nicht akzeptiert. Ist jedoch die Nahfeld- Situation wahr- 
scheinlicher, so wird als Ergebnis 12 der Sprecherortung der 
Index des entschiedenen Sektors im FeinrastermaB ausgege- 
ben. 

[0025] Die Sektorentscheidung in den Stufen 16, 17 und 
18 beruht jeweils auf der Bestimmung eines Koharenzma- 
Bes. Entschieden wird fur denjenigen Sektor, fur den das 
KoharenzmaB am groBten ist. 

[0026] Die in Fig. 2 dargesteilte Schaltungsanordnung zur 
KoharenzmaB-Bestimmung (Stufe KOMB) fuhrt eine Aus- 
wertung pro Teilband und pro Sektor durch und kommt in 
den Stufen 16, 17 und 18 zur Anwendung. 
[0027] Die komplexen Fourier-Koeffizienten 26 (Fi ... 
Fr) gelangen iiber einen Datenpuffer 21 und einen Schalter 

23 zur Betragsbildung in die Stufe 29 mit anschlieBender 
Summation iiber K Kanale 31 und darauffolgender Quadrie- 
rung 33. Das Ergebnis 34 wird in einem Datenspeicher 35 
zwischengespeichert und kann bei Bedarf als Signalwert 36 
ausgegeben und iiber den Schalter 37 weiterverarbeitet wer- 
den. 

[0028] Diese Vorgehensweise erspart Rechenaufwand, da 
die Fourier-Koeffizienten 26 zwar vom Teilband,' nicht aber 
vom Sektor abhangen, also nur einmal mit Gtiltigkeit fur 
alle Sektoren ausgewertet werden. 

[0029] Die komplexen Array-Koeffizienten 27 (Ai ... 
Ak) gelangen uber einen Datenpuffer 22 und einen Schalter 

24 als Signal 40 in die Multiplizierstufe 41; in der pro Kanal 
eine Multiplikation mit den entsprechenden Fourier-Koeffi- 
zienten 28 erfolgt. Das Ergebnis 42 wird in der Stufe 43 iiber 
alle Kanale surnmiert und von dem Ausgangs signal 44 wird 
in 45 das Betragsquadrat gebildet. Das Ergebnis 46 wird zu- 
sammen mit dem Signal 38 aus der Verarbeitung. der Fou- 
rier-Koeffizienten der Divisionsstufe 39 zugefuhrt. Das Er- 
gebnis 47 ist der Koharenzwert: 



KOW = 



der einen Wert zwischen 0 und 1 annimmt, sofern die Array- 
Koeffizienten A i . . . A K auf den Betrag Eins normiert sind. . 
Je geringer der Abstand zwischen dem gepriiften Sektor und 
der tatsachlichen Sprecherposition ist, um so groBer wird 
der Koharenzwert KOW. In der Stufe 48 erfolgt eine zeitli- 
che Mitteilung von KOW durch Summation iiber N aufein- 
anderfolgende Zeitpunkte. Der gemittelte Wert 49 wird an- 
schlieBend mit dem vom Teilband abhangigen Gewichtsfak- 
tor 50 gewichtet. Diese Gewichtung ermoglicht es, weniger 
zuveriassige Koharenzwerte abzuschwachen, z. B. solche 
fur tiefe Frequenzen, bei denen der Abstand zwischen zwei 
Mikrofonen erheblich kleiner als die Wellenlange ist. Als 
Ergebnis wird das Signal 51 ausgegeben, das als Koharenz- 
maB KOM bezeichnet wird und das pro Teilband und pro 
Sektor ermittelt wird. 

[0030] Fig. 3 zeigt die Details zur Grobsuche in der Stufe 
16. Aus den Fourier-Koeffizienten 6 und den Array-Koeffi- 
zienten 7 wird in der Stufe 60 (KOMB nach Fig. 2) das Ko- 
harenzmaB KOM berechnet und als Signal 62 ausgegeben. 
Das MaB KOM wird fiir alle L Teilbander jeweils pro zu 
priifenden Sektor ausgegeben; die Reihenfolge zur Bearbei- 
tung der Koeffizienten wird in der Stufe 61 iiber die Leitun- 
gen 63! und 63 2 und die Schalter 64 und 71 gesteuert. In der 
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Stufe 66 werden die M groBten Werte von KOM aus den 
KoharenzmaBen 65 x . . . 65 L fur den zu priifenden Sektor be- 
stimrnt. Die Indices 67 der dazugehorigen M Teilbander . 
werden im Datenspeicher 670 zwischengespeicherL 
[0031] In der Stufe 69 werden die ermittelten M groBten 5 
Werte von KOM, 68 t . . .68 M summiert, und der Summen- 
wert 70 wird uber den Schalter 71 der Stufe 73 zugefuhrt. 
Die so beschriebene Signalauswertung wird entsprechend 
fur alle SG Grobsektoren ausgefuhrt, so daB an der Stufe 73 
die Eingangssignale 72!... 72 SG anliegen. In 73 wird der 10 . 
groBte aus den SG Werten bestimmt und als Signal 77 der 
Vergleichsschaltung 79 zugefuhrt. Der dazugehorige Index 
des Grobsektors 74 gelangt zum Sch alter 75 und zum Daten- 
speicher 670. 1st das KoharenzmaB KOM G auf Leitung 77 
groBer als ein vorzugebender Schweiiwert 78, so wird das 15 
Ergebnis der Sektorsuche im Grobraster akzeptiert und mit 
dem Schalter 75 als Signal 76 (Index des entschiedenen 
Grobsektors) ausgegeben. Gleichzeitig werden aus dem Da- 
tenspeicher 670 diejenigen Indices der M Teilbander ausge- 
lesen und als Signal 671 ausgegeben, die dem entschiedenen 20. 
Grobsektor 76 uber die Verbindung 67 zugeordnet wurden. 
[0032] Fig. 4 zeigt die Details zur Feinsuche in der Stufe 
17. Aus den Fourier- Koeffizienten 6 und den Array-Koeffi- 
zienten 8 wird in der Stufe 80 (KOMB nach Fig, 2) das Ko- . 
harenzmaB KOM berechnet und als Signal 82 ausgegeben. 25 
Das MaB KOM wird nur fur die durch 671 festgelegten M 
Teilbander berechnet 

[0033] Diese Berechnung erfolgt fur alle zu priifenden 
Feinsektoren. 

[0034] Durch Einspeisen von 671 und 76 in die Stufe 81 30 
wird die Auswahl der dazugehorigen Teilmenge der Daten 
gesteuert. Die Reihenfolge zur Bearbeitung der Koeffizien- 
ten wird uber die Ausgangssignale 83i und 832 und die 
Schalter 84 und 88 gesteuert. Die Summation der M Koha- 
renzmaBe 85i . . . 85 M in der Stufe 86 fuhrt auf den Sum- 35 
menwert 87, der uber den Schalter 88 der Stufe 90 zugefuhrt 
wird. Diese Signalauswertung wird entsprechend fur alle SF 
Feinsektoren ausgefuhrt, so daB an der Stufe 90 die Ein- 
gangssignale 89t . . . 89 S f anliegen. In 90 wird der groBte 
aus de n SF Werten bestimmt und als KoharenzmaB 92 40 
(KOM F ) ausgegeben. Der dazugehorige Index dieses Fein- 
sektors erscheint als Signal 91 am Ausgang der Stufe zur * 
Feinsuche. 

[0035] Fig. 5 zeigt die Details zur Nah-/Fem-Prufung in 
der Stufe 18. Aus den Fourier-Koeffizienten 6 und den Ar- 45 
ray-Koeffizienten 9 wird in der Stufe 100 (KOMB nach Fig. 
2) das KoharenzmaB KOM berechnet und als Signal 102 
ausgegeben. Das MaB KOM wird nur fur die durch 671 fest- 
gelegten M Teilbander berechnet; diese Berechnung erfolgt 
nur fur den Sektor, der durch den Index 91 festgelegt ist 50 
Durch Einspeisen von 671 und 91 in die Stufe 101 wird die 
Auswahl der-dazugehorigen Teilmenge der Daten gesteuert 
und der uber 103 kontrollierte Schalter 104 betatigt Die 
Summation der M KoharenzmaBe 105i . . . 105 M und der 
Stufe 10 6 fuhrt auf den Summenwert 107, der das Koha- 55 
renzmaB KOMpp fur das Feinraster-Fernfeld reprasentiert. 
Die Sign ale 10 7 und 92 (letzterer reprasentiert das Koha- 
renzmaB KOMp fur das Feinraster-Nahf eld) we rden in die 
Vergle ichsschaltung 108 eingespeist. Ist KOM F groBer als 
KOMfb so wird die Feinsektor-Entscheidung akzeptiert und 60* 
liber den Schalter 110 als Ergebnis 12 (Index des entschiede- 
nen Feinsektors) angegeben. 

Patentanspriiche 

65 

1 . Verfahren zur Sprecherlokalisierung mit Hilfe eines . 
Mikrofonarrays, bei dem alle Mikrofonsignale des Ar- 
rays gleichzeitig ausgewertet werden und der Sprecher- 
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raum in endlich viele Sektoren aufgeteilt und der zu- 
treffende Sektor nach Kriterien der Piausibilitat ausge- 
wahlt wird, dadurch gekennzeichnet, daB die laufzeit- 
bzw. phasenkorrigierten, einzelnen Mikrofonsignale 
vor der Bildung des Array-Summensignals miteinan- 
der auf Koharenz der Phasenlage gepruft werden und 
danach der Sektor mit maximaler Koharenz ausgewahlt 
wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeich- 
net, daB wahrend der Prufung auf Koharenz der Pha- 
senlage variierende Frequenzbandbeschneidungen vor- 
genommen werden, wobei die Frequenzbandbeschnei- 
dung ebenfalls nach dem Kriterium der maximalen Ko- 
harenz durchgefuhrt wird. 

3. Verfahren nach Anspruch 1 und 2, dadurch gekenn- 
zeichnet, daB die Prufung auf Koharenz der Phasenlage 
in eine Grobsuche mit geringer Unterteilung in wenige 
Sektoren und eine anschlieBende Feinsuche mit starke- . 
rer Unterteilung der bei der Grobsuche ermittelten Sek- 
toren mit zulassigen Sprecherpositionen im Nahbe- 
reich des Arrays aufgeteilt wird. 

4. Verfahren nach Anspruch 1 bis 3, dadurch gekenn- 
zeichnet, daB fur die Prufung der Zulassigkeit des Sek- 
tors der Sprecherposition ein zusatzlicher Koharenz- 
vergleich mit einer Schallquellenposition durchgefuhrt 
wird, die den gleichen Raumwinkel zum Mikrof on ar- 
ray gemaB dem Ergebnis der Grob- und Feinsuche auf- 
weist, jedoch dem Fernbereich des Arrays zugehort. 

5. Verfahren nach Anspruch 1 bis 4, dadurch gekenn- 
zeichnet, daB wahrend der Prufung auf Koharenz der ' 
Phasenlage eine Vielzahl von Daten komplexer Fre- 
quenzbereichs-Signalwerte gebildet, gespeichert und 
mit ebenfalls gespeicherten, komplexen Koefi5zienten 
zur Phasenkorrektur bewertet werden, die der jeweili- 
gen zu priifenden Sprecherposition zugeordnet sind. 
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